Model Selection

Text Feature Extraction

# Text Feature Extraction

Nomic Embed Text V2 Moe Unsupervised

This is an intermediate version of a multilingual Mixture of Experts (MoE) text embedding model, obtained through multi-stage contrastive training

A Turkish BERT model pre-trained by Trendyol, suitable for various natural language understanding tasks.

Large Language Model

Transformers Other

Snowflake Arctic Embed M

Snowflake Arctic Embed M is a sentence transformer model focused on sentence similarity tasks, capable of efficiently extracting text features and calculating similarity between sentences.

Labse En Ru Myv V2

This is a multilingual embedding model based on LaBSE, supporting Russian and Moksha languages, fine-tuned on the myv_ru_2022 dataset.

Large Language Model

Transformers Other

STAR is a supervised contrastive pretraining transformer model for social media writing style understanding.

Simcse Ja Bert Base Clcmlp

This is a BERT-based Japanese SimCSE model, specifically designed for extracting high-quality sentence embeddings from Japanese sentences.

Transformers Japanese

Sbert Chinese General V1

A general-purpose Chinese sentence embedding model for calculating sentence similarity and semantic search tasks.

Transformers Chinese

envibert is a bilingual model based on the RoBERTa architecture, supporting Vietnamese and English processing, optimized for production environments.

Large Language Model

Transformers Other

Debertav2 Base Uncased

BERT is a pre-trained language model based on the Transformer architecture, trained on English corpus through masked language modeling and next sentence prediction tasks.

Large Language Model English

Chinese Roberta L 8 H 256

A Chinese RoBERTa model pretrained on CLUECorpusSmall, with 8 layers and 512 hidden units, suitable for various Chinese NLP tasks.

Large Language Model Chinese

Distilbert Feature Extraction

DistilBERT is a lightweight distilled version of BERT, retaining 97% of BERT's performance while being 40% smaller in size.

Large Language Model

A Transformer model pre-trained on English corpus using self-supervised learning similar to ELECTRA, trained by predicting replaced tokens.

Large Language Model

Transformers English

funnel-transformer

Bert Base Irish Cased V1

gaBERT is a BERT-based monolingual Irish language model trained on 7.9 million Irish sentences, suitable for fine-tuning downstream tasks in Irish.

Large Language Model

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase